Ce projet vise à comparer le transcriptome (RNASeq) d’échantillon de cellules souches issues de dents de sagesse, mises en culture puis extraites à différents point temporels :
Des échantillons issus de filles et de garçons sont disponibles.
Nous avons à notre disposition 20 échantillons, issus de plusieurs conditions différentes pour lesquelles des données de 3 donneurs ont été générés :
La qualité des données de séquencage, d’alignement, la distribution des données brutes ainsi que l’expression des gènes “contrôles” sont détaillés dans le rapport de QC.
Les analyses différentielles sont réalisées avec le package R DESeq2 (test de Wald et correction Benjamini-Hochberg) à partir des données de quantification par gène issues de Salmon.
Les gènes différentiellement exprimés sont sélectionnés comme étant ceux avec une p-value ajustée < 0.05 et un log2 fold-change >1 ou < -1.
Les enrichissement de pathways sont calculés grâce à un test de sur-représentation de listes de gènes, via le package R clusterProfiler. Les pathways testés sont issus de la base Molecular Signatures Database (MSigDB) V6.2 (1738 pathways testés) :
Les résultats d’enrichissement de liste de gènes détaillent :
Une AFC est réalisée à partir des comptages bruts par gène (quantification Salmon) afin d’observer la structure des données et la position des différents échantillons les uns par rapport aux autres. Son interprétation est la même que celle de l’ACP, l’intéret de l’AFC étant, ici, de pouvoir être effectuée sur des données brutes, non normalisées, et ainsi d’avoir une description de la cohorte avant normalisation.
Les échantillons sont colorés selon leur temps d’extraction.
On voit que les échantillons J4 se séparent bien des autres sur le plan Axe1-Axe2, et que l’axe 3 permet de séparer les échantillons J0. C’est de bonne augure pour les analyses différentielles, car le profil transcriptomique de ces groupes d’échantillons est différent.
On remarque aussi que l’échantillon 20 est atypique sur le premier plan, de même que l’échantillon 19, qui se sépare des autres J0 sur le deuxième plan.
La figure ci-dessous illustre la distance entre les différents échantillons de la cohorte à partir des données d’expression normalisées par DESeq2.
Plus deux échantillons sont proches (distance faible), plus leurs transcriptomes présentent de similarités.
Note: les échantillons 19 et 20 sont pour l’instant exclus des analyses car issus d’une expérience différente.
Liste des gènes différentiellement exprimés tous les gènes DE, classés par p-value ajustée (FDR)
Liste des gènes différentiellement exprimés tous les gènes DE, classés par p-value ajustée (FDR)
Liste des gènes différentiellement exprimés tous les gènes DE, classés par p-value ajustée (FDR)
Liste des gènes différentiellement exprimés tous les gènes DE, classés par p-value ajustée (FDR)
Liste des gènes différentiellement exprimés tous les gènes DE, classés par p-value ajustée (FDR)
## No results
Liste des gènes différentiellement exprimés tous les gènes DE, classés par p-value ajustée (FDR)
Liste des gènes différentiellement exprimés tous les gènes DE, classés par p-value ajustée (FDR)
Liste des gènes différentiellement exprimés tous les gènes DE, classés par p-value ajustée (FDR)
Liste des gènes différentiellement exprimés tous les gènes DE, classés par p-value ajustée (FDR)
On compare ici les gènes différentiellement exprimés trouvés dans les 2 analyses (sur tous les échantillons, sans séparer les filles et les garçons).
On peut faire une heatmap de tous les échantillons sur l’union de ces 3 listes.
Avec la méthode de single sample GSEA, on calcul un score d’enrichissement pour des pathways d’inflammation pour chaque échantillon.
On peut ensuite regarder l’évolution de ce score entre échantillons, même si on ne peut pas faire de test statistique sans réplicats.
## Estimating ssGSEA scores for 2 gene sets.
##
|
| | 0%
|
|==== | 5%
|
|======= | 10%
|
|========== | 15%
|
|============== | 20%
|
|================== | 25%
|
|===================== | 30%
|
|======================== | 35%
|
|============================ | 40%
|
|================================ | 45%
|
|=================================== | 50%
|
|====================================== | 55%
|
|========================================== | 60%
|
|============================================== | 65%
|
|================================================= | 70%
|
|==================================================== | 75%
|
|======================================================== | 80%
|
|============================================================ | 85%
|
|=============================================================== | 90%
|
|================================================================== | 95%
|
|======================================================================| 100%